Enabling Smart Data: Noise filtering in Big Data classification
نویسندگان
چکیده
منابع مشابه
Enabling Smart Data: Noise filtering in Big Data classification
In any knowledge discovery process the value of extracted knowledge is directly related to the quality of the data used. Big Data problems, generated by massive growth in the scale of data observed in recent years, also follow the same dictate. A common problem affecting data quality is the presence of noise, particularly in classification problems, where label noise refers to the incorrect lab...
متن کاملSmart Big Data
Die intelligente Nutzung von digitalen Daten spielt eine zentrale Rolle, wenn es darum geht, Antworten auf zukünftige wirtschaftliche und gesellschaftliche Herausforderungen zu geben. Software ist hierbei der fundamentale Werkstoff für innovative Produkte und Dienstleistungen. Die Wettbewerbsfähigkeit der deutschen Wirtschaft wird entscheidend von der Fähigkeit abhängen, softwarebasierte Produk...
متن کاملEnabling Global Big Data Computations
Most analytics projects focus on the management of the 3Vs of big data and use specific stacks to support this variety. However, they constrain themselves to “local” data, data that exists within or “close” to the organization, or external data imported to local systems. And yet, as it has been recently pointed out, “the value of data explodes when it can be linked with other data.” In this pap...
متن کاملthe clustering and classification data mining techniques in insurance fraud detection:the case of iranian car insurance
با توجه به گسترش روز افزون تقلب در حوزه بیمه به خصوص در بخش بیمه اتومبیل و تبعات منفی آن برای شرکت های بیمه، به کارگیری روش های مناسب و کارآمد به منظور شناسایی و کشف تقلب در این حوزه امری ضروری است. درک الگوی موجود در داده های مربوط به مطالبات گزارش شده گذشته می تواند در کشف واقعی یا غیرواقعی بودن ادعای خسارت، مفید باشد. یکی از متداول ترین و پرکاربردترین راه های کشف الگوی داده ها استفاده از ر...
Correct classification for big/smart/fast data machine learning
Table (database) / Relational database Classification for big/smart/fast data machine learning is one of the most important tasks of predictive analytics and extracting valuable information from data. It is core applied technique for what now understood under data science and/or artificial intelligence. Widely used Decision Tree (Random Forest) and rare used rule based PRISM , VFST, etc classif...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: Information Sciences
سال: 2019
ISSN: 0020-0255
DOI: 10.1016/j.ins.2018.12.002